狗熊会开学季:新学期,从这些数据科学系列书籍开始
开学啦!新学期,新目标,新挑战!亲爱的小伙伴们,你们都准备好了吗?
在新学期开始之际,为了帮助同学们更好地规划学习生活,游刃有余地去迎接各种挑战,狗熊会将为大家陆续送上数据科学专业的学习“锦囊”,和您一起开启学习之旅!
今天,我们为大家送上狗熊会结合多年教学和实战经验推出的14本数学科学系列书籍。这些书有的已经被一些高等院校数据科学相关专业作为教学的通用教材,有的已经成为了企业继续教育的培训教材,同时也是很多小伙伴们拓宽视野、增强实战能力的自学用书。
《数据思维:从数据分析到商业价值》
作者:王汉生
这是一本非常有特点的数据科学入门专著,熊大用通俗易懂的语言,表达出数据科学中非常深刻的道,即“朴素的数据价值观”,利用数据思维结合具体的业务场景,将数据转化为成为可感知的商业价值。全书围绕三大方面的内容进行阐述。第一,讲数据和价值。第二,谈回归分析,这是统计学在数学技术上的手段,是“术”的层面;更高层面是“道”的层面,把业务问题定义为数据可分析问题,这是特别重要的方法论。最后,通过大量案例来分析“数据模型是如何产品化的”。
本书同时也是一本商业分析领域入门专著,既适合大学数据科学相关专业教学和学习参考使用,也适合数据分析师、工程师、产品经理、销售人员、业务拓展人员及企业高管等阅读。
《商务统计学基础》
作者:王汉生、王菲菲
在大数据时代背景下,统计学作为数据分析领域的基础,被应用于各行各业,其方法发挥着重要作用。为了更广泛地普及统计学知识,培养更多的统计学人才,本书应运而生。
作为入门图书,本书内容安排如下。第1章从不确定性出发,讲述统计学和不确定性的关系,以及统计学中用于描述不确定性的各种概率模型。第2章是参数估计,系统讲述统计学中矩估计和极大似然估计两种常用的参数估计方法,并基于两种方法介绍各种常见概率分布中参数的点估计和区间估计。第3章是假设检验,先从不确定性的角度探讨实际中的各种决策问题,帮助读者理解假设检验的思想和应用场景,然后系统介绍假设检验的方法论及各种常见推广。第4章是回归分析,先介绍回归分析的思想和广泛的应用场景,然后系统地介绍各类常用模型,从线性回归到广义线性回归, 落脚到两种机器学习算法(决策树、神经网络)。
《Excel 商务数据分析与应用》
作者:常莹、朱振涛
这是一本以“培养数据与业务的双语者”为目标的通用教材,适合数据科学类专业学生的数据科学概论课程,也可作为商学等学科的数据科学技能通识课教材。本书以实践领域中数据分析工作的流程为主线,介绍每个步骤中与数据分析相关的基础知识和基本技能,并通过解决真实问题的训练来帮助学生掌握相关知识,提高学生解决问题的能力。每章都安排“实践练习”环节,引导读者使用本章及前面各章学习过的知识和技能来解决实际问题。本书选择了数据分析工具中学习成本最低Excel,以便广泛地帮助需要掌握数据分析技能的人更加顺利、高效地掌握使用数据解决实际问题的基础能力。
《统计分析:以R语言为工具》
作者:朱雪宁
这部书的创作初衷是希望结合R语言这一统计分析工具,对统计分析的知识和流程有一个详细的分解和梳理。全书共分为八章。第一章提纲挈领,介绍统计分析的基本步骤及R语言基础。第二章重点介绍R语言中的数据管理及数据清洗。第三章、第四章介绍数据基本统计分析、描述分析及可视化方法。第五章讲解统计分析中的参数估计与假设检验。第六到八章介绍几个重要的统计模型,包括线性回归、逻辑回归、降维分析。对于所涵盖的统计分析知识,本书尽量以浅显易懂的方式介绍原理,并以R语言为工具,辅以实现方法的讲解。
本书适合大学二年级及以上的相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者。本书以尽量浅显易懂的语言讲解模型知识,避免过分复杂的数学推导过程。同时,本书注重实战和案例讲解,力求做到学以致用。
《R语言:从数据思维到数据实战》
作者:朱雪宁
编程语言之于数据分析是必不可少的。对于一个数据科学的新人来说,应该从哪门语言开始呢?摆在面前的选择很多:R、SAS、Python、C、Java甚至Forton。它们各有优势,也有不足。如果一定要选一个,推荐R。这一本《R语言:从数据思维到数据实战》从R语言简介和优势入手,到数据读取、清洗、描述、建模等数据分析的各个环节,由浅入深逐个讲解,采用大量的实际案例辅以说明,是一本实务分析中的“R语言指南”。
本书适合刚刚入门或者了解R语言但还没有认识到R语言在实际数据分析中强大威力的朋友。或许你是一个编程小白,渴望入门一种较为容易上手的编程语言,但又在庞大的知识体系前望而却步;或许你还在求学,刚刚学习了R语言编程,但是又想了解不止于如何生成一个数组或者矩阵这么简单;有或许你是一个业界从业者,逐渐认识到手上开始积累越来越多的数据,它们也许能产生巨大的商业价值,而却无所适从。这本书能帮您打开一扇R语言实战的大门。
《数据思维实践》
作者:潘蕊
《数据思维实践》是一本数据科学人才培养的实战指导教材,在“识”和“用”两个维度找到了一个完美结合点。一是优先考虑到读者的实际业务需求,在书中每个环节设置了相关挑战,并以挑战引出教学,让读者学以致用;二是独创的TASK驱动人才培养方式,创新了数据科学教育的模式。全书框架沿用了人才计划的TASK,注重自学和实战两方面的训练。从解决商业问题的角度出发,涵盖数据分析的选题与背景、数据的获取与描述、模型的建立、表达与沟通和案例收录五大核心模块。能帮助读者快速建立系统的数据分析框架,提高利用数据分析工具进行业务分析的能力,成为一位具有商业分析能力的数据科学人才。
这本书适合高等院校数据科学相关专业作为教学的通用教材,也可作为企业继续教育的培训教材,还可以作为拓宽视野、增强实战能力的自学用书。
《商务数据分析与应用--基于R(第2版)》
作者:王汉生、成慧敏
这是我们熊大的又一力作,确切的说是之前“绿皮书”的升级版,《商务数据分析与应用--基于R(第2版)》。此次再版有哪些改动呢?首先不变的是教学理念。都是从案例出发,产生业务问题,引出学术问题,然后再讲述统计学知识。此次再版主要的修改体现在以下几个方面。第一、案例需要修改。例如十几年前的房价跟现在太不一样了,因此二手房的案例需要更新了。更新的不仅仅是数据采集时间,还有更大的数据量,以及更丰富有趣的字段。当然,还有其他很多案例都更新了,使得整个教材所涉及的故事更加丰富有趣。第二、代码要更新。过去的代码都是最简单的R代码,可读性差。但是,现在的小朋友们都喜欢用R Markdown创作。因此,本书将R代码用漂亮的R Markdown重新整理出来。第三、报告更新。这是一个很重要的部分。毕竟所有的数据分析都是为了解决业务问题。而如何解决业务问题,需要一个规范的商业分析报告来呈现。因此,本次改版对每章的商业分析报告作了大幅的完善。最后,为了帮助大家的学习,增加了思维导图,还更新了课后作业。部分的R代码录制了视频,可以在狗熊会的慕课平台上收看。此外,为方便老师授课,还准备了全套制作精美的PPT,希望能够对授课老师有所帮助。
《Python数据科学实践》
作者:常象宇、曾智亿、李春艳、程茜
本书并不是一本介绍Python的大而全的手册,而是利用Python语言去讲述数据科学中最基本的核心理念是如何实现的一本手册。狗熊会一直倡导的数据价值理念,应该从理解业务问题出发,获取数据,清洗数据,探索性数据分析,构建变量体系,建立模型,模型评估等都在本书中利用Python的不同模块给予了讲解。如果想要深刻理解本书中的所有内容,可以首先去学习狗熊会的《数据思维:从数据分析到商业价值》这本书,理解如何真的利用数据去解决业务问题。其次,可以去学习狗熊会的《数据思维实践》这本书,理解实践数据思维的基本过程。最后,应该真的实践的时候到了,Python将会成为你数据科学实践的有力武器。
《网络结构数据分析与应用》
作者:潘蕊、张妍、高天辰
当今社会,网络结构数据普遍存在于各个行业。如何从这些数据中挖掘价值,并且解决实际问题,成为学界和业界共同关注的研究方向。本书主要帮助读者初步了解网络结构数据,学习使用R语言进行实际数据分析。
本书共七章。第一章主要讲解了为什么关心网络结构数据,介绍了R语言以及常用的包,同时整理了一些常用的网络数据集。第二章介绍了网络结构数据的定义及分类,并整理了大量实例以帮助读者快速熟悉网络结构数据。第三章讲解了网络结构数据的可视化,重点介绍了针对大规模网络的可视化方法及网络的动态交互式可视化。第四章介绍了 描述网络特征的各种统计量及重要的网络结构,并给出了实例。第五章重点介绍了三种经典的网络结构数据模型,第六章主要介绍了网络结构数据中社区发现的相关概念及方法,并整理了常见的评价指标及标准数据集,通过实例向读者展示社区发现的应用场景。第七章介绍了网络结构数据分析中的链路预测问题。本书适合网络结构数据的初学者,相关专业的学生或对网络结构数据感兴趣的读者阅读。
《时间序列分析》
作者:涂云东
本书以时间序列模型为基础,以经济学和管理学中的案例为载体,采用理论讲解与数据分析案例实践相结合的方式编写而成。全书共9章,包括时间序列分析基础、线性时间序列模型、单位根时间序列模型、非线性时间序列模型、协整时间序列模型、波动率模型、时间序列的机器学习方法、时间序列的深度学习方法和课程综合案例等内容。
本书配有PPT课件、教学大纲、数据集、R语言代码、课后习题答案、模拟试卷及答案等教学资源,使用本书的老师可在人邮教育社区免费下载使用。
本书不仅可以作为统计学、数据科学等相关专业本科生学习数据建模相关课程的教材,也可以作为研究生、政府人员和企业管理人员学习预测和决策方法的培训书或自学书。
《深度学习:从入门到精通》
作者:王汉生、周静
《深度学习:从入门到精通》,本书全面系统地讲解了深度学习相关的知识。全书8章,内容包括深度学习简介及TensorFlow安装,神经网络基础、神经网络的TensorFlow实现、卷积神经网络基础、经典卷积神经网络(LeNet、AlexNet、VGG、Inception、ResNet、DenseNet、MobileNet)、深度学习用于文本序列(词嵌入、RNN、LSTM、机器翻译等)和深度学习实验项目等内容。以知识体系为基础,以课堂案例为载体,采取理论与实践相结合的教学模式,通过知识讲解和上机实验,使刚刚入门的小白不仅掌握深度学习的理论基础,而且能够实现基本的代码。
《深度学习笔记》
作者:鲁伟
这本书来自狗熊会人才计划学员、资深的深度学习业界从业者,鲁伟。整本书非常恰当地反映了鲁伟作为一个学生的学习态度。笔记记录了他辛苦探索的过程,而且内容极其丰富。从经典的神经网络出发,到各种优化算法,到卷积神经网络,各种图像应用,再到以循环神经网络为基础的各种自然语言处理模型。他的笔记一定会惠及更多的渴望在深度学习方面入门的朋友。其次,“笔记”非常恰当地反映了这本书的定位,不是从老师高高在上向下传授的角度,而是从学生努力学习的角度陈述。非常通俗、生动、易懂。对于很多初学者而言,就像是有一个勤奋好学的大师兄,在你艰难深度学习的道路上,为你默默助力。最后,“笔记”也告诉大家,鲁伟自己在这条道路上还是一个学生,显然他还不是专家,也请大家多多批评指正。相信大家的建设性意见能够帮助鲁伟成长为一个更优秀的个体!
《数据资产论》
作者:王汉生
这是熊大的又一本力作,全书从数据的基本概念出发,讲述在业务场景中践行数据商业价值,进而对数据资产的定价、确权、交易、治理做了全方面剖析,辅以生动有趣的案例,浅显易懂,是国内一部系统阐述数据资产理论体系和实践方法的专家著作。
运用统计学理论和丰富有趣的实践案例,熊大在书中阐述了数据价值的研究背后是不确定性问题,在预测不准情况下数据模型的价值,如何洞察并创新新的商业模式。同时,他还指出因数据资产的特殊性,数据确权、定价和交易都是独特的。对数据资产的治理,是对数据资产所有相关方利益的协调与规范,结合实例给出在实践操作中的建设性意见,给人以启迪。
全书带有较强的时代性、专业性与实用性,独特视角进一步填补了数据资产领域的理论体系空白。所有大数据相关从业人员,行业新人或从业多年的数据专家、资深人士都能从中得到启发,引导读者根据自身经验,从各个维度上进行独立、深入的思考,是一本带有极强的实践性指导意义的数据产业领域重要著作。
《数据领导力》
作者:王安、常莹
与之前的《数据思维》等图书不同,这本书聚焦的不是抽象的思想方法,而是陪伴数据产业一同成长起来的一群人,记录他们在企业的数据化转型和自己的职业发展中所遇到的问题,和为了解决问题而付出的努力。太阳底下无新事,数据产业的发展虽然在加速,但先行者曾遇到过的很多典型问题,仍然横亘在后来者前进的路上。希望《数据领导力》中所记载的这些经历,可以为正在进行数据化转型的企业、准备和已经进入数据科学实践行业的同行们,提供一些有益的启发和建议。
目前狗熊会出版的系列书籍相关的数据代码,基本都可以在慕课平台(入口:公众号点击右下角的慕课平台【资源下载】或点击本文【阅读原文】),进入资源下载板块获得,欢迎小伙伴们下载,希望对大家的学习有所帮助。
新学年,新希望,新开始!让我们整装待发,元气满满,和狗熊会一起开启数据科学学习之旅吧!